Modèle d'Evaluation des Systèmes et Ressources Applicables à la Correction d'Erreurs dans les Documents
نویسندگان
چکیده
RÉSUMÉ. L'adoption massive des services dits du Web 2.0 a entraîné une augmentation de la quantité d'informations produites. La quantité d'erreurs contenues dans ces informations a quant à elle évolué de façon plus importante. En effet, si dans un processus de production d'information classique les documents étaient issus de professionnels, dans le cadre du Web, ce sont principalement les utilisateurs qui en sont à l'origine avec les imperfections que cela peut entraîner. Il est donc nécessaire de prendre en compte ces erreurs dans les systèmes amenés à gérer des informations de qualité variable. Notre état de l'art nous a conduits à identifier des difficultés quant à l’évaluation comparative des stratégies de correction d’erreurs au travers des systèmes qui les implémentent. Cet article présente donc un modèle d’évaluation des systèmes de correction d’erreurs et des ressources de bas-niveau (mesures de similarité/distance entre chaînes de caractères, dictionnaires, ...) sur lesquelles ces systèmes s’appuient. Ce modèle a été implémenté au sein d’un prototype extensible qui fournit un cadre technique de base pour l’évaluation.
منابع مشابه
Étude sur les portails et agrégateurs des ressources pédagogiques universitaires francophones en accès libre
A ces trois grands objectifs stratégiques, deux autres objectifs (ou exigences) d'ordre technologique et culturel sont également à prévoir dans la construction d'un portail francophone commun de ressources pédagogiques gratuites : 1. D'abord, une exigence technique (et technologique) de convergence et de cohérence avec les pratiques internationales dans la conception et la diffusion des ressour...
متن کاملLa Conception Innovante : synthèse de systèmes ou résolution de problèmes ?
Résumé TRIZ est une méthode de résolution de problèmes inventifs, initialement développée en ex Union Soviétique et qui commence à se diffuser largement. C’est une méthode non formalisée qui utilise des connaissances capitalisées à partir de milliers de brevets, qui synthétisent en quelque sorte, les problèmes abstraits résolus par ces brevets et qui leur associe des solutions abstraites. La mé...
متن کاملStructured Indexing Model for Cross-Language Information Retrieval
In recent digital library systems or World Wide Web environment, parallel corpora are used by many applications (Natural Language Processing, machine translation, terminology extraction, etc.). This paper presents a new cross-language information retrieval model based on the language modeling. The model avoids query and/or document translation or the use of external resources. It proposes a str...
متن کاملUn Modèle Homogène pour la Confidentialité et l'Intégrité des Données Relationnelles
Les systèmes d’information sont devenus omniprésents dans les organisations, et ne sont plus cantonnés à un nombre limités d’applicatifs : qu’il s’agissent de données d’exploitation, de rapports confidentiels ou d’une devanture accessible sur Internet, les systèmes d’information s’étendent dans toutes les branches des organisations. La sécurité est aujourd’hui un des enjeux considérables des sy...
متن کاملفایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان
Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...
متن کامل